• 1. Instrucciones
  • 2. Preguntas
    • a. Pregunta 1 - (20 puntos)
    • b. Pregunta 2 - (20 puntos)
    • c. Pregunta 3 - (20 puntos)
    • Referencias

1. Instrucciones

Este documento contiene las instrucciones y enunciados asociados a la Prueba Especial Programada 2 (PEP2) del curso de Estadística Computacional. Con respecto a ello:

  • La prueba tiene un total de 60 puntos, lo que sumado al puntaje base permitirá calcular directamente su nota final sumando un máximo de 70 puntos.
  • Las actividades están desarrolladas para trabajar en grupos de dos estudiantes. Sin embargo, no existe problema si alguien quiere trabajar individualmente.
  • Se dispone de todo el bloque de clases para realizar la evaluación. Esta deberá ser desarrollada en R.
  • Las respuestas escritas empleando RMarkdown deberán ser enviadas al profesor por correo electrónico al finalizar el tiempo de evaluación.
  • Puede usar apuntes y material disponible en Moodle como apoyo.
  • Cualquier sospecha de falta ética será castigada directamente con nota 1.0 en la evaluación.

2. Preguntas

a. Pregunta 1 - (20 puntos)

Uno de los principales desafíos en el campo de la Bioinformática es la predicción de la estructuras tridimensional de proteínas usando como base su estructura primaria (secuencias de aminoácidos). Este problema complejo, NP-hard, es abordado en ciencia de la computación como un problema de optimización usando algoritmos de aproximación estocásticos.

El trabajo desarrollado por (Inostroza-Ponta et al. 2020) propuso varios algoritmos para lidiar con este problema, dos de ellos son LS1 y LS2. En su trabajo estos algoritmos fueron ejecutados 31 veces para predecir la estructura de la proteína 3P7K, registrando los errores entre a la estructura original de la proteína y su estimación para cada ejecución (RMSD). Los resultados simulados basados en la media y desviación estándar de la publicación se pueden descargar desde este sitio.

  • Analice los datos y determine si uno de los dos algoritmos logró predicciones con menor error para la proteína 3P7K.
  • Contextualice su respuesta para el problema.

b. Pregunta 2 - (20 puntos)

Un estudio desarrollado en Cuba analizó la relación entre la enfermedad renal quística adquirida (ERQA) (Bacallao 2014), y su relación con variables clínicas, demográficas y antropométricas en pacientes dialíticos.

Los autores indicaron como parte de los resultados de su estudio, la existencia de una relación “directa” y “moderada” entre el tiempo de duración de las sesiones de hemodiálisis (meses) y número de quistes en los pacientes. Al capturar los datos originales del estudio (Descarga) usando la herramienta WebPlotDigitizer y la biblioteca ggplot2, se obtuvo el siguiente gráfico:

010203040500100200300
Número de quistes y tiempo en hemodiálsisTiempo en hemodiálisis en mesesNúmero de quistes
  • Use el coeficiente de correlación de Pearson para verificar y concluir respecto a la relación señalada por los autores. Para este fin utilice la función cor.test().
  • Proponga y evalúe un modelo de regresión lineal simple para explicar la relación entre tiempo en hemodiálisis y número de quistes. Grafique.

c. Pregunta 3 - (20 puntos)

El trabajo desarrollado por (Navarrete-Mejía 2020) evaluó si la diabetes e hipertensión arterial son factores de riesgo de mortalidad en pacientes con Covid-19. Para ello, los autores analizaron datos de pacientes mayores a 30 años atendidos en el Hospital de Emergencia Ate Vitarte (HEAV) en los meses de marzo y agosto 2020. La totalidad de pacientes tenía diagnóstico confirmado COVID-19.

El resumen de pacientes fallecidos y no fallecidos (alta médica) para cada comorbilidad es el siguiente:

Factor de riesgo Paciente fallecido Paciente alta
Con diabetes 111 169
Sin diabetes 542 1125
Factor de riesgo Paciente fallecido Paciente alta
Con hipertensión 157 186
Sin hipertensión 496 1108
  • Determine si la diabetes e hipertensión son factores de riesgo para la mortalidad en pacientes COVID-19. Estudie ambas comorbilidades de manera independiente.
  • Analice los resultados obtenidos contextualizando su respuesta al problema.

Referencias

Bacallao, Mendez Antonio. 2014. Enfermedad renal quística adquirida y su relación con variables clínicas, demográficas y antropométricas en pacientes dialíticos. Rev Cubana Med 53: 291–99.
Inostroza-Ponta, Mario, Márcio Dorn, Iván Escobar, Leonardo de Lima Correa, Erika Rosas, Nicolás Hidalgo, and Mauricio Marin. 2020. “Exploring the High Selectivity of 3-d Protein Structures Using Distributed Memetic Algorithms.” Journal of Computational Science 41: 101087. https://doi.org/https://doi.org/10.1016/j.jocs.2020.101087.
Navarrete-Mejía, Frank Antonio AND Velasco-Guerrero, Pedro Javier AND Lizaraso-Soto. 2020. Diabetes mellitus e hipertensión arterial como factor de riesgo de mortalidad en pacientes con Covid-19.” Revista Del Cuerpo Médico Hospital Nacional Almanzor Aguinaga Asenjo 13: 361–65.